采用Seq2Seq模型的非受限词义消歧方法 |
唐善成,马付玉,张镤月,陈熊熊 |
西安科技大学 通信与信息工程学院 |
|
摘要:
词义消歧在中文自然语言处理中有着重要作用,基于传统机器学习的方法存在准确度不高,需要人工提取文本特征的缺点;基于深度学习的方法不适于词义歧义较多的情况。该文提出采用Seq2Seq模型的非受限词义消歧方法,输入词上下文序列,经过编码器编码得到潜在语义向量,再经过解码器解码输出词义序列,适用于所有词义歧义情况。最后,在SemEval2007 Task #5任务中进行测试,测试结果表明,该文提出的方法比其他7种方法中的最优方法消歧准确率提高了11.48%。
|
关键词:
自然语言处理;词义消歧;Seq2Seq
|
发表年限: 2019年 |
发表期号: 第3期 |
|
|
|